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摘要 : 太阳 黑子 与 渴 斑 的 爆发 存在 紧密 联系 ， 因 此 及 时 准确 地 检测 全 日 面 图 像 中 的 太阳 黑 
子 可 以 为 耀 斑 的 预报 提供 依据 。 基 于 深度 学 习 框 架 的 LeNet-5 卷 积 神经 网 络 实现 了 一 种 太 
阳 黑 子 自动 检测 方法 ， 主 要 步 又 包括 : 制作 太阳 黑子 样本 库 、 训 练 全 卷 积 神经 网 络 模型 
Sunspotsnet 、 检 测 和 标记 全 日 面 像 中 的 太阳 黑子 。 实 验 结果 表明 , 该 方法 可 以 识别 
SDO/HMI 的 全 日 面 连续 谱 图 像 上 各 种 类 型 的 黑子 ， 尤 其 是 较 弱 的 磁 孔 (0.88 倍 平 均 光 球 强 
度 ) ， 条 用 基于 深度 学 习 的 方法 检测 太阳 黑子 是 可 行 的 ， 训 练 的 Sunspotsnet 网 络 模 型 可 
以 快速 有 效 地 应 用 在 太阳 黑子 的 检测 上 。 
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太阳 黑子 是 太阳 表面 强 磁场 的 典型 表现 ， 与 太阳 活动 有 紧密 的 联系 ， 比 如 耀 斑 和 日 晃 
物质 抛射 。 这 些 活动 会 扰乱 地 球 大 气 层 ， 使 地 面 的 无 线 电 短波 通讯 受到 影响 ， 产 生 磁 暴 现 
象 等 。 相 关 研 究 表明 " 3， 太 阳 黑 子 群 与 焰 斑 的 爆发 存在 紧密 联系 ， 检 测 太阳 黑子 可 以 为 炊 
斑 的 预报 提供 相应 的 依据 ， 因 此 正确 及 时 地 检测 太阳 黑子 非常 重要 。 

目前 在 太阳 黑子 的 识别 问题 上 主要 采用 图 像 处 理 技术 中 的 形态 学 、 小 波 分 析 等 技术 手 
段 。 比 如 ， 文 [4 提出 了 采用 形态 学 膨胀 、 腐 蚀 等 方法 自动 检测 太阳 黑子 ， 文 [5-7] 通 过 形 
态 学 项 帆 变 换 、 手 工 设 定 阐 值 的 方法 识别 黑子 ; 文 [8] 提 出 了 一 种 基于 小 波 的 识别 太阳 黑子 
的 方法 ; 文 [9] 采 用 水 平 集 识 别 和 跟踪 太阳 黑子 。 这 些 方法 都 需要 解决 太阳 临 边 昏暗 的 问题 ， 
同时 强烈 依赖 于 太阳 黑子 的 强度 和 特征 信息 ， 一 般 需要 通过 阅 值 法 达到 检测 太阳 黑子 的 目 
的 。 

深度 学 习 "" 是 指 在 多 层 神 经 网 络 上 运用 各 种 机 器 学 习 算 法 解决 图 像 、 文 本 等 问题 的 算 
法 集合 。 近 年 来 在 语音 识别 " "、 自 然 语言 处 理 "W、 目 标识 别 和 分 类 "等 领域 取得 了 巨大 的 
进展 。 它 的 核心 是 深度 特征 学 习 ， 通 过 分 层 网 络 获取 分 层次 的 特征 信息 ， 从 而 解决 以 往 需 
要 人 工 设 计 特 征 的 重要 难题 。 其 中 ， 卷 积 神经 网 络 是 一 种 以 卷 积 运算 为 核心 的 深度 学 习 神 
经 网 络 ， 相 比 以 往 的 浅 层 机 器 学 习 模 型 ， 其 在 特征 提取 表达 和 模型 拟 合 上 有 着 前 所 未 有 的 
优势 。 它 通过 卷 积 运 算 组 合 低层 特征 ， 能 得 出 具有 更 加 抽象 和 本 质 的 高 层 特征 ， 尤 其 在 具 
有 复杂 结构 的 信息 处 理 上 有 着 优异 的 表现 。 

本 文 在 文 [14]LeNet-5 卷 积 神经 网 络 的 基础 上 ， 训 练 了 一 个 太阳 黑子 的 全 卷 积 神经 网 
络 模型 Sunspotsnet， 并 实现 了 一 种 基于 深度 学 习 的 全 日 面 图 像 上 太阳 黑子 的 自动 检测 和 
标注 方法 。 


1 卷 积 神经 网 络 和 LeNet-5 

卷 积 神经 网 络 (Convolutional Neural Networks, CNN) 是 一 种 非常 适合 图 像 目 标识 
别 的 深度 学 习 网 络 。 特 点 是 通过 多 层 卷 积 运算 从 大 数据 中 自动 学 习 并 获取 图 像 特征 ， 并 通 
过 神经 元 的 局 部 连接 和 权 值 共享 等 策略 优化 ， 从 而 有 效 地 减少 传统 的 深层 网 络 模型 的 参数 
数量 ， 降 低 网 络 的 复杂 度 。 通 常 由 以 下 3 部 分 组 成 : 

(1) 卷 积 层 : 卷 积 层 (convolutional layer) 计算 输入 数据 和 多 个 滤波 器 的 卷 积 运算 ， 
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以 特征 图 (Feature Map, FM) 的 形式 输出 。 每 个 特征 图 由 多 个 神经 元 组 成 ， 这 些 神经 元 是 由 
上 一 层 中 的 一 个 “感受 野 ” 通 过 卷 积 后 再 加 偏 置 最 后 经 过 激励 函数 得 到 的 。 不 同 的 卷 积 核 
可 提取 输入 数据 的 不 同 特征 ， 比 如 低层 卷 积 一 般 提 取 图 像 的 边缘 、 线 条 走向 、 颜 色 等 低级 
特征 ， 而 高 层 的 卷 积 提取 某 个 组 成 部 分 的 形状 、 组 合 等 高 级 特征 。 

(2) 池 化 层 : 池 化 层 (Pooling Layer) 也 叫 下 采样 层 。 池 化 层 一 般 使 用 在 卷 积 层 之 后 ， 
目的 是 降低 特征 图 的 分 辨 率 获 得 空间 不 变性 特征 ， 同 时 降低 数据 规模 ， 防 止 过 拟 合 的 发 生 
一 般 采 用 最 大 化 、 平 均 化 或 随机 化 进行 池 化 。 

(3) 全 连接 层 : 网 络 在 获取 了 数据 的 各 级 特征 后 ， 就 可 以 使 用 全 连接 整合 特征 。 最 后 
一 个 全 连接 层 的 结果 输入 到 输出 层 ， 输 出 层 也 可 以 理解 为 分 类 器 ， 其 中 较为 常用 的 
logistic, Softmax 回归 吧 数 通过 计算 神经 元 的 概率 分 布 完成 分 类 问题 。 

Caffe 框架 下 的 LeNet-5 是 一 种 成 功用 于 识别 手写 数字 的 8 层 卷 积 神经 网 络 ， 由 1 个 输 

入 层 和 1 个 输出 层 、2 个 卷 积 层 、2 个 池 化 层 和 2 个 全 连接 层 组 成 。 第 1 个 卷 积 层 设 置 了 20 
个 5*5 的 卷 积 核 ; 接着 池 化 层 采 用 2*2 的 最 大 池 化 ; 第 2 个 卷 积 层 为 50 个 5*5 WERE; 
接着 仍 用 2*2 做 最 大 池 化 ; 然后 第 1 次 全 连接 得 到 500 个 神经 元 ; 采用 ReLU 激活 函数 进行 
非 线 性 化 激活 ; 再 通过 全 连接 得 到 10 个 神经 元 ， 最 后 输出 层 通 过 Softmax 函数 输出 10 个 
概率 值 ， 完 成 10 分 类 。 


2 数据 与 方法 
2. 1 数据 

数据 采用 SDO (Solar Dynamics Observatory) 卫星 的 HMI (Helioseismic and 
Magnetic Imager) 连续 谱 全 日 面 图 像 ， 以 2014 年 的 数据 作为 太阳 黑子 样本 库 的 来 源 ， 一 
共 提 取 了 4789 个 太阳 黑子 样本 和 197 个 背景 样本 ， 分 别 随 机 抽取 80% 的 样本 作为 训练 集 、 
20% 作 为 验证 集 进行 网 络 训练 。 从 2011 年 到 2016 年 全 日 面 图 像 中 提取 了 100 个 不 同类 型 的 
黑子 数据 和 非 黑 子 数据 作为 外 部 测试 集 进 行 网 络 测试 。 网 络 模 型 测试 成 功 后 ， 对 全 日 面 连 
续 谱 图 像 进行 了 太阳 黑子 的 自动 检测 。 


2. 2 样本 库 制 作 

本 文 提出 的 方法 主要 分 为 3 部 分 : CO 提取 太阳 黑子 和 背景 的 样本 图 像 ， 制 作 太 阳 黑 子 
样本 标签 库 ; (2) 以 LeNet-5 为 基础 ， 调 整 其 网 络 结构 为 适合 太阳 黑子 检测 的 网 络 模型 ， 之 
后 训练 和 测试 ; (3) 网 络 模型 训练 成 功 后 ， 多 尺度 缩放 待 检 图 像 后 输入 到 训练 好 的 网 络 模型 
计算 候选 目标 的 分 类 概率 ， 筛 选 出 符合 阐 值 的 太阳 黑子 , 采用 非 极 大 值 抑 制 进行 标注 。 

样本 库 的 标签 需要 两 类 ， 一 类 为 太阳 黑子 样本 ， 另 一 类 为 非 太 阳 黑 子 样本 。 对 全 日 面 
图 像 采 用 形态 学 腐蚀 和 膨胀 等 运算 ， 表 用 阐 值 法 提取 太阳 黑子 ， 根 据 太 阳 黑 子 的 位 置 和 大 
小 截取 正方 形 黑子 区 域 ， 调 整 其 大 小 为 28*28 (如 图 1) ， 并 设置 成 标签 为 1 的 样本 。 除 此 
之 外 ， 也 用 手工 的 方式 增加 了 一 些 特 殊 的 黑子 样本 ， 比 如 非常 靠近 日 面 边缘 的 黑子 、 特 别 
弱 的 小 黑子 或 磁 孔 。 然 后 再 在 日 面 的 不 同位 置 截取 一 些 不 包含 黑子 的 背景 图 片 作为 标签 为 
0 的 背景 样本 。 最 后 将 这 些 已 标注 为 0 和 1 标签 的 样本 分 别 转化 为 LMDB 格式 的 训练 数据 文 


件 和 验证 数据 文件 。 


Fig. 1Cases from the sample library : the first fourcasesaresunspots samples, and the last are background 


图 1 样本 库 案例 :前 4 个 为 黑子 样本 ， 后 四 个 为 背景 样本 
samples. 


2. 3Sunspotsnet 网 络 模型 设计 

LeNet-5 模型 由 于 最 后 两 个 全 连接 层 输出 为 标量 的 形式 , 因而 要 求 输入 图 像 的 尺寸 与 样 
本 库 的 一 致 。 这 就 意味 着 大 于 28*28 的 图 像 无 法 直接 输入 LeNet-5 网 络 中 检测 。 一 种 解决 
思路 是 训练 好 网 络 后 ， 将 全 连接 层 转 换 成 等 价 的 卷 积 层 。 另 一 种 思路 是 采用 全 卷 积 神经 网 
#8 (Full Convolution Networks，FCN) 。 全 卷 积 神经 网 络 是 一 种 用 卷 积 层 取 代 全 连接 层 的 


神经 网 络 ， 由 于 两 类 层 中 的 神经 元 都 是 计算 点 积 ， 其 函数 形式 相同 ， 因 此 可 以 将 此 两 者 相 
互 转换 "”。 本 文采 用 第 2 种 方案 ， 设 计 了 一 个 全 卷 积 神经 网 络 Sunspotsnet， 如 图 2。 该 网 
络 共 有 8 层 ， 包 括 输入 层 和 输出 层 ，4 层 卷 积 层 (conv1、conv2、conv3、conv4) 和 2 层 池 
化 层 (pool1、poo12) 。 样 本 库 的 尺寸 为 28*28， 第 1 个 卷 积 层 用 30 个 5*5 的 卷 积 核 卷 积 
后 得 到 30 个 24*24 的 特征 图 ; 然后 用 的 池 化 核 最 大 池 化 为 30 个 12*12 的 特征 图 ; 接着 
第 2 个 卷 积 层 用 50 个 5*5 的 卷 积 核 卷 积 得 到 50 个 8*8 的 特征 图 ; 再 池 化 和 得 到 50 个 4*4 的 
特征 图 ; 第 3 个 卷 积 层 对 应 Lenet- se 个 全 连接 层 ， 对 应 的 卷 积 核 为 2003284. BFR 
后 得 到 500 个 1*1 的 特征 图 ， 接 着 采用 ReLU 进行 对 其 非 线 性 激活 ; 第 4 个 卷 积 层 为 2 个 
1*1 的 卷 积 核 ， 卷 积 后 得 到 2 个 1*1 的 FM; 最 后 通过 Softmax 函数 得 到 像素 级 别 的 分 类 概 
率 (prob) 。 
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图 2Sunspotsnet 网 络 结构 示意 图 
Fig. 2Sunspotsnet network structure diagram 
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2. 4Sunspotsnet 网 络 模型 训练 

训练 卷 积 神经 网 络 的 目的 是 训练 每 一 个 卷 积 层 的 滤波 器 。 通 过 包含 卷 积 、 池 化 等 一 系 
列 运 算 的 前 向 传播 算法 计算 其 分 类 概率 和 损失 函数 的 损失 值 ， 然 后 又 把 损失 值 通过 反 上 向 传 
播 算法 反馈 给 整个 卷 积 神经 网 络 ， 即 计算 各 层 梯 度 ， 比 如 随机 梯度 下 降 算 法 (Stochastic 
Gradient Descent, SGD), ， 不 断 调整 各 个 滤波 器 的 权重 ， 使 得 损失 值 最 小 。 我 们 测试 了 
50000 次 的 迭代 训练 了 该 网 络 。 在 迭代 到 5000 次 时 ， 准 确 率 已 经 达到 了 1， 这 意味 着 该 网 
络 只 需要 5000 次 迭代 就 已 经 收敛 。 


2.5 Sunspotsnet 网 络 模型 测试 

网 络 训练 成 功 后 ， 可 以 用 测试 集中 的 数据 进行 网 络 的 测试 ， 结 果 显 示 所 有 图 片 均 乱 
了 正确 的 识别 结果 。 表 1 列 出 了 部 分 测试 图 片 的 预测 概率 及 分 类 结果 ， 黑 子 1-7 对 应 标签 
的 概率 值 都 高 达 0. 99， 而 黑子 8 是 个 很 弱 的 磁 孔 ， 概 率 值 降 为 0. 76, 可见 所 有 黑子 分 类 结 
果 正 确 ; 背景 图 片 中 非 日 面 和 边缘 的 对 应 标签 0 的 概率 很 高 ， 而 背景 1 和 3 由 于 与 很 弱 的 
磁 孔 样本 非常 相似 ， 因 此 对 应 标签 0 的 概率 值 仅 为 0. 68 $80. 72， 相 对 较 低 一 些 ， 所 有 背景 
分 类 结果 正确 。 

表 1Sunspotsnet 网 络 模 型 的 测试 结果 
Table 1 The test results of Sunspotsnet 


测试 
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2.6 全 日 面 图 像 太 阳 黑 子 检测 
网 络 模型 测试 成 功 后 ， 可 以 用 该 模型 检测 全 日 面 图 像 中 的 太阳 黑子 。 受 内 存 容量 与 
caffe 框架 采用 的 blob 数据 格式 对 数据 量 的 限制 ， 对 全 日 面 图 像 进行 1024*1024 的 小 区 域 


划分 后 输入 网 络 进行 检测 。 主 要 包括 以 下 几 个 步 又: 将 图 像 进行 多 尺度 变换 后 输入 
Sunspotsnet 网 络 模型 ， 通 过 前 向 传播 算法 计算 各 滑动 区 域 的 分 类 概率 ， 再 筛选 出 超过 某 
一 阅 值 的 区 域 ， 回 归 到 原 图 上 的 坐标 位 置 ， 最 后 通过 非 极 大 值 抑制 后 在 原 图 上 标注 黑子 区 
域 。 具 体 步 又 如 下 : 

(1) 多 尺度 变换 : 由 于 全 日 面 图 像 上 的 太阳 黑子 大 小 不 一 ， 所 以 采用 图 像 多 尺度 的 缩 
放 变 换 产 生 不 同 尺 度 的 图 像 。 即 输入 原始 尺寸 ， 然 后 不 断 缩小 图 像 ， 直 至 全 日 面 图 像 上 最 
大 的 太阳 黑子 能 被 缩小 到 28*28 的 范围 内 ， 这 样 能 保证 全 日 面 图 像 上 大 小 各 异 的 黑子 都 能 
被 识别 。 本 文 按 第 24 周 2014 年 10 月 24 日 出 现 的 最 大 黑子 的 尺寸 估计 ， 将 全 日 面 图 像 最 
小 缩 到 了 448*448 。 
(2) 全 卷 积 网 络 计 算 概 率 和 矩阵 ; 将 不 同 尺 度 图 像 输 入 Sunspotsnet 中 ， 通 过 前 向 传播 算法 
得 到 对 应 的 概率 矩阵 。 
(3) 筛选 太阳 黑子 ; 筛选 概率 值 超过 阅 值 的 太阳 黑子 ， 结 合 多 尺度 缩放 的 比例 ， 计 算 太 阳 
黑子 的 原始 坐标 。 
(4) 标注 太阳 黑子 : 根据 太阳 黑子 坐标 值 进 行 非 极 大 值 抑制 后 在 原 图 上 标注 。 由 于 同一 个 
黑子 在 多 尺度 的 缩放 比例 下 可 能 都 会 被 识别 成 黑子 ， 产 生 在 一 个 黑子 区 域 上 有 多 个 不 同 大 
小 的 矩形 框 的 情况 ， 所 以 通过 非 极 大 值 抑制 运算 ， 在 一 定 区 域 上 挑选 出 候选 框 中 识别 概率 
最 高 的 一 个 作为 最 终 的 黑子 标记 框 ， 从 而 抑制 元 余 的 矩形 框 。 非 极 大 值 抑 制 的 过 程 是 一 个 
和 迭代 -遍历 -消除 的 过 程 : 首先 将 所 有 和 矩形 框 根据 概 率 排序 ， 然 后 从 最 大 概率 的 矩形 框 开 始 ， 
遍历 其 余 框 ， 如 果 和 当前 和 矩形 框 的 重 亚 度 大 于 某 个 设 定 的 冰 值 〈 本 文 取 0.01) ， 则 丢弃 该 
框 ; 再 从 未 处 理 的 框 中 继续 选 一 个 概率 最 高 的 ， 重 复 上 述 过 程 。 


3 实验 结果 

本 文采 用 HMI 的 全 日 面 连续 谱 图 像 进行 测试 ， 其 中 包含 了 黑子 数量 较 少 、 黑 子 数量 较 多 以 
及 黑子 位 置 关系 复杂 等 不 同类 型 的 全 日 面 图 像 。 图 3 给 出 了 4 个 局 部 区 域 的 案例 ， 为 了 能 
清晰 地 看 到 图 中 的 黑子 ， 对 原 图 进行 了 灰 度 拉 升 。 (a) 为 2011 年 1 月 20 日 08:00UT 
AR11147 的 区 域 ; (b) A (a) 检测 的 结果 ; (c) 为 2011 年 5 月 7 日 12:00UT 
AR11203、11204、11205 的 区 域 ; (d) 为 (c) 检测 的 结果 ; (e) 为 2011 年 10 月 10 日 20:00UT 
AR11312 的 区 域 ; (F) 为 (e) 检测 的 结果 ; (g) 为 2011 年 12 月 10 日 08:00UT AR11364 的 区 域 
(h) 为 (g) 检测 的 结果 。 可 以 看 出 ， 无 论 是 较 强 的 黑子 还 是 较 弱 的 磁 孔 , 日 面 中 心 附近 还 是 边 
缘 的 黑子 ， 检 测 的 效果 良好 。 尤 其 是 那些 尺寸 较 小 的 磁 孔 ， 即 使 其 强度 很 弱 ， 均 可 以 得 到 
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图 3(a) 2011-1-208:00UT AR11147 区 域 ; (b) 深度 学 习 图 (a) 后 检测 的 结果 ; (c) 2011-5-712:00UT AR11203，11204，11205 区 
域 ; (d) 深度 学 习 图 (c) 后 检测 的 结果 ; (e) 2011-10-1020:00UT AR11312 区 域 ，(f) 深度 学 习 图 (e) 后 检测 的 结果 ; (e) 2011- 
12-1008:00UT AR11364 区 域 ; (h) 深度 学 习 图 (g) 后 检测 的 结果 。 

Fig.3(a) AR11147 on Jan. 20, 2011 08:00UT; (b) The detection result of (a); (c)AR11203，11204，11205 on May 7, 
2011 12:00UT; (d) The detection result of (c); (e) AR11312 on Oct. 10, 2011 20:00UT; (f) The detection result 
of (e); (g) AR11364 on Dec. 10, 2011 08:00UT; (h)The detection result of (g) 


表 2 列 出 了 对 这 4 个 区 域 用 人 工 识别 的 方法 识别 到 的 黑子 〈 包 括 小 磁 孔 ) 总 数 、 用 本 
文 方法 识别 的 黑子 总 数 、 漏 识别 的 黑子 个 数 。 经 过 认真 比 对 ， 本 文 方法 没有 错误 识别 的 情 
况 ， 只 有 漏 识 别 的 情况 ， 识 别 率 约 为 80%。 本 文 还 对 4 个 区 域 分 别 选取 了 一 块 宁静 区 域 计 
算 平 均 光 球 强度 ， 并 统计 了 人 工 识别 的 所 有 黑子 中 最 弱 一 个 的 强度 ， 以 及 本 文 方法 识别 出 
的 黑子 中 最 弱 一 个 的 强度 。 人 工 识别 的 黑子 中 最 弱 的 磁 孔 强度 约 为 平均 光 球 强度 的 0. 90 f, 
而 本 文 方法 能 探测 到 最 弱 的 磁 孔 约 为 宁静 区 域 平均 强度 的 0. 88 倍 。 从 图 4 中 亦 可 看 出 ， 那 
些 尚 未 识别 出 来 的 黑子 尺寸 都 非常 小 ， 其 强度 已 非常 接近 于 平均 光 球 强度 。 


表 2 检测 结果 


Table 2 The detection results 


区 域 人 工 识别 的 ”本文 方法 漏 识别 黑子 “<L os> 人 工 识别 中 最 弱 “本 文 识 别 中 最 弱 的 
黑子 总 数 个 数 的 黑子 强度 黑子 强度 
AR11147 区 域 35 24 m 5.854e+04 5.58e*04 5.143e+04 
(0.96«I os>) (0.88«I os>) 
AR11203,11204, 43 36 7 5.88904 5.301e+04 5.172e*04 
11205 区 域 (0.90«I os) (0.88«I os») 
AR11312 区 域 24 20 4 6.104e+04 5.364e+04 5.305e+04 
(0.88<I os>) (0.87<L os>) 
AR11364 区 域 3 3 0 4.667e+04 4.04e+04 4.04e+04 
(0.87«1 os>) (0.87«1 os>) 
pun 105 83(80%) 22(20%) (0.90<I_QS >) (0.88«I QS >) 
+ 
4 模型 综合 分 析 


卷 积 神经 网 络 模型 的 参数 配置 非常 重要 ， 主 要 包括 学 习 率 (base_lr) 、 和 迭代 次 数 
(lters) 、 批 处 理 数据 量 (batch_size) 、 卷 积 核 大 小 、 池 化 核 大 小 和 特征 图 数量 。base_lr 
主要 用 来 控制 深度 学 习 收 敛 的 度 ， 是 反 向 传播 计算 时 负 梯 度 的 权重 ， 其 大 小 直接 影响 随机 
梯度 下 降 算法 的 调整 次 数 及 效果 。 值 太 大 容易 出 现 超 调 现象 ， 即 在 极 值 点 两 端 不 断 发 散 ; 
太 小 导致 无 法 快速 地 找到 好 的 下 降 方向 。5000 次 迭代 下 0. 001 和 0. 01 的 学 习 率 在 耗 时 上 的 
差别 并 不 大 ， 但 由 于 0. 001 的 学 习 率 过 小 ， 所 以 在 5000 次 迭代 后 正确 率 还 没有 0. 01 的 高 。 
但 学 习 率 一 旦 设置 为 0. 02 及 以 上 时 ， 损 失 值 就 会 较 高 ， 这 就 意味 着 学 习 率 的 设置 有 个 明显 
的 拐点 。batch_size 是 每 一 次 训练 使 用 的 数据 量 ， 原 则 上 其 值 越 大 ， 确 定 的 下 降 方 向 越 准 ， 
但 是 过 大 易 导 致 训练 时 间 和 空间 消耗 较 大 ， 反 过 来 其 值 过 小 使 下 降 的 方向 难以 收敛 。 若 
batch size 为 500 时 训练 的 时 间 明 显 加 长 。 如 果 把 base_Ir 也 设 得 很 小 ， 训 练 时 间 则 更 长 。 
该 模型 的 batch_size 设置 为 10， 就 已 经 达到 很 好 的 训练 效果 。 

本 文 因 样本 图 片 尺寸 较 小 ， 因 此 卷 积 核 设置 为 3*3 或 7*7 时 差别 并 不 明显 。 另 外 ， 池 
化 核 的 设置 也 会 影响 网 络 的 深度 ， 池 化 核 太 大 则 网 络 的 深度 就 会 小 ， 特 征 的 粒度 变化 过 大 
而 在 忽略 过 拟 合 的 情况 下 ， 池 化 核 小 则 深度 较 深 ， 其 网 络 性 能 也 较 好 ， 本 文 因 样本 图 像 尺 
寸 较 小 ， 因 此 池 化 核 大 小 设置 为 2。 特征 图 数量 的 设置 也 很 关键 ， 太 少 的 特征 图 数量 会 忽 
略 一 些 对 分 类 有 影响 的 特征 ， 太 大 的 特征 图 数量 则 易 浪 费 计 算 资 源 导致 时 间 和 计算 成 本 增 
加 。 有 研究 发 现 相 比 各 层 特征 图 都 相同 的 卷 积 神经 网 络 ， 特 征 图 数量 按 金字 塔 形 逐 层 递 增 
的 设置 方法 能 更 有 效 地 综合 计算 资源 和 模型 性 能 。 

综合 以 上 的 各 项 指标 ， 本 文采 用 了 base Ir 为 0.01、batch_size 为 10、 卷 积 核 大 小 为 
5、 池 化 核 大 小 为 2、 各 层 特征 图 的 数量 采用 30+50+500+2 的 组 合 完 成 了 网 络 模型 的 训练 。 


需要 说 明 的 是 ， 这 样 的 参数 并 不 一 定 最 佳 ， 这 也 可 以 说 是 卷 积 神经 网 络 的 一 个 特点 ， 有 多 
个 较 优 解 。 


5 总 结 和 展望 

本 文 基于 深度 学 习 框架 下 的 LeNet-5 卷 积 神经 网 络 ， 训 练 了 一 个 Sunspotsnet 全 卷 积 
神经 网 络 模型 ， 并 采用 该 网 络 模型 实现 了 对 全 日 面 图 像 上 的 太阳 黑子 进行 自动 检测 和 标注 
经 HMI 的 全 日 面 连续 谱 图 像 的 测试 结果 表明 检测 的 效果 好 ， 尤 其 对 较 弱 的 磁 孔 “可 达 0. 88 
售 平均 光 球 强度 ) 、 日 面 边缘 的 黑子 等 特殊 情况 检测 的 效果 良好 。 该 方法 在 网 络 模 型 训练 
的 过 程 中 需要 调试 一 些 参 数 ， 但 是 模型 一 旦 训 | 练 好 ， 就 可 广泛 地 应 用 于 太阳 黑子 的 检测 工 
作 。 当 然 ， 本 文 方法 还 存在 一 些 问题 ， 比 如 caffe 框架 对 图 像 尺 寸 的 限制 ， 滑 动 搜 索 黑 子 
区 域 的 效率 比较 低 以 及 图 像 缩放 和 非 极 大 值 抑制 策略 等 问题 。 下 一 步 的 工作 计划 是 采用 深 
度 学 习 进 行 黑子 群 分 类 、 预 测 光 斑 等 相关 的 研究 工作 。 
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A Detection Method for sunspots based on 
Convolutional Neural Network LeNet-5 
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Abstract:Sunspots are closely linked with flares eruption. Detecting the 
sunspots from full-disk continuous images timely and accurately could provide 
clues to predict flares. In this paper, we implement a new detecting method for 
sunspots from HMI full-disk continuous images, which is based on convolutional 
neural network LeNet-5 under the deep-learning framework. A sample library of 
sunspots is set up, and a full convolutional neural network names as 
Sunspotsnet is trained, and finally a detection method for sunspots from full- 
disk continuous images based on Sunspotsnet is proposed. The results show that 
this method can detect the different kinds of sunspots, especially faint pores 
(0. 88<l_as>). It is feasible to detect the sunspots from full-disk continuous 
images based on deep-learning technology. This trained convolutional neural 
network named as Sunspotsnet can be employed in detecting the sunspots 
quickly and effectively. 

Key words: Sunspot; deep-learning;convolution neural networks 


